Es el valor que se encuentra en el centro de una secuencia ordenada
de datos. Hay la misma cantidad de datos por encima y por debajo de
ella.
\(\begin{equation}
\text{Mediana} =
\begin{cases}
X_{\frac{n+1}{2}}, & \text{si } n \text{ es impar} \\
\frac{X_{\frac{n}{2}} + X_{\frac{n}{2} +1}}{2}, & \text{si } n
\text{ es par}
\end{cases}
\end{equation}\)
Ventaja: fácil de interpretar y calcular, no es
sensible a valores extremos.
Moda
Es el valor que aparece con mayor frecuencia, se utiliza en fines
descriptivos ya que es muy variable para diferentes muestras. Puede
haber más de una moda.
Un conjunto de datos puedes ser unimodal, bimodal o multimodal.
Ejemplo
Calcular la media, mediana y moda de la edad, altura y dinero en
efectivo de los estudiantes del grupo 6 de Estadística General:
Id
Edad
Altura
(cm)
Dinero
en efectivo (COP)
1
18
170
2000
2
20
180
65000
3
21
178
20000
4
22
159
20000
5
20
158
2500
6
20
175
100
7
21
162
1000
8
23
172
20
9
20
184
30
10
19
155
45
11
22
164
50000
12
26
175
1500000
13
22
180
1000000
14
20
185
250
15
23
178
60000
16
21
173
200000
17
22
162
50
18
21
173
52
19
22
168
40
20
20
165
4
21
23
180
150
Ejemplo
Calcular la media, mediana y moda de la edad, altura y dinero en
efectivo de los estudiantes del grupo 6 de Estadística General:
[1] "La variable Edad (años) tiene una media de 21.14, su mediana es 21 y su moda es 20"
[1] "La variable Altura (cm) tiene una media de 171.55, su mediana es 173 y su moda es 180"
[1] "La variable Dinero (COP) tiene una media de 169613.64, su mediana es 50000 y su moda es 20000"
# Formula modamoda <-function(x) { ux <-unique(x) ux[which.max(tabulate(match(x, ux)))]}link_encuesta <-"https://docs.google.com/spreadsheets/d/e/2PACX-1vRSn6T8sclb-P9UeGkh305w-8fs-rPR1_ritC2FPOLS2Ub13KUr_vF1dvRb0ZYr582s3aXD2gEVziGL/pub?gid=1539739636&single=true&output=csv"data <-read.csv(link_encuesta)# Edadmedia_edad <-round(mean(data$Edad), digits=2)mediana_edad <-median(data$Edad)moda_edad <-moda(data$Edad)# Alturamedia_altura <-round(mean(data$Altura..cm.), digits=2)mediana_altura <-median(data$Altura..cm.)moda_altura <-moda(data$Altura..cm.)# Dineromedia_dinero <-round(mean(data$Dinero.en.efectivo), digits=2)mediana_dinero <-median(data$Dinero.en.efectivo)moda_dinero <-moda(data$Dinero.en.efectivo)print(paste0("La variable Edad (años) tiene una media de ", media_edad, ", su mediana es ", mediana_edad, " y su moda es ", moda_edad))print(paste0("La variable Altura (cm) tiene una media de ", media_altura, ", su mediana es ", mediana_altura, " y su moda es ", moda_altura))print(paste0("La variable Dinero (COP) tiene una media de ", media_dinero, ", su mediana es ", mediana_dinero, " y su moda es ", moda_dinero))
Medidas de dispersión
Rango
\(\begin{equation}
Rango = Valor_{máximo} - Valor_{mínimo}
\end{equation}\)
Propiedades:
Fácil de calcular.
Sensible a valores extremos.
No considera la distribución de los datos.
Posible dependencia del tamaño de la muestra.
Puede ser problemático para comparar diferentes
conjuntos de datos o muestras.
Brinda una vista rápida y sencilla de la dispersión
y sobre la presencia de datos atípicos significativos.
Los cuantiles sirven para estudiar o analizar lo que sucede con algún
porcentaje de datos en particular, cuando se han ordenado previamente
los datos. Los cuantiles se dividen en cuartiles, deciles y
percentiles.
p-tiles
Cuartil: genera cuatro intervalos, cada
uno con el 25% de los casos.
Quintil: genera cinco intervalos, cada uno
con el 20% de los casos.
Decil: genera 10 intervalos, cada uno con
el 10% de los casos.
Veintil: genera 20 intervalos, cada uno
con el 5% de los casos.
Percentil: genera 100 intervalos, cada uno
con el 1% de los casos.
N personalizado: es posible determinar el
número de intervalos, según sea la necesidad. Por ejemplo, un valor de 3
produciría 3 categorías agrupadas (2 puntos de corte), cada una de las
cuales contendría el 33.3% de los casos.
Percentiles
El percentil es un valor tal que el P por ciente de
las observaciones son menores a tal valor.
Ejemplo: suponga que la nota del parcial es 4.1 y
esa nota corresponde al percentil 90. Esto indica que el 90% de los
estudiantes obtuvieron una nota entre 0.0 y 4.1 o que sólo el 10% sacó
más de 4.1.
Para calcular los percentiles primero se deben ordenar los datos.
Percentiles
\[\text{Dec} = \frac{i*n}{100} \text{ ; i
es el percentil a calcular} \]
\[P_{i} = \begin{cases}
X_{(\lfloor Dec \rfloor + 1)} & \text{si } Dec \neq 0 \\
\frac{X_{Dec} + X_{Dec+1)}}{2} & \text{si } Dec = 0
\end{cases}\]